查看原文
其他

GPT-4 重磅发布,吊打 ChatGPT!编程能力牛到让我睡不着:10秒做出一个网站,1分钟开发一个游戏

刘燕、Tina InfoQ 2023-03-27

作者 | 刘燕、Tina
OpenAI 的新“核弹”来了,并且它还非常擅长编码。

3 月 14 日晚间,OpenAI 宣布发布 GPT-4。

“我们创建了 GPT-4,这是 OpenAI 努力扩展深度学习的最新里程碑。GPT-4 是一个大型多模态模型(接受图像和文本输入,提供文本输出),虽然在许多现实世界场景中的能力不如人类,但在各种专业和学术基准上表现出人类水平”,OpenAI 表示。

OpenAI 联合创始人 Sam Altman 表示,它是“迄今为止功能最强大、最一致的模型”,能够使用图像和文本。

为什么这张图片很可笑?GPT-4 回答道,VGA 线充 iPhone。

最近这几个月,ChatGPT 的爆火,让人们惊叹于人工智能强大的聊天能力。GPT4 出来后,可以看到,在聊天之外,人工智能的能力已不断扩展其外延。

ChatGPT 用的语言模型是 GPT-3.5。在谈到 GPT-4 比前一个版本强大在哪里时,OpenAI 称,虽然这两个版本在随意的谈话中看起来很相似,但“当任务的复杂性达到足够的阈值时,差异就会出现”,GPT-4 更可靠、更有创意,并且能够处理更细微的指令。该公司表示,GPT-4 响应禁止内容请求的可能性比其前一个版本低 82%。OpenAI 表示,在内部评估中,GPT-4 产生正确回应的可能性要比 GPT-3.5 高出 40%。

而且 GPT-4 是多模态的,同时支持文本和图像输入功能。此外,GPT-4 比以前的版本“更大”,这意味着其已经在更多的数据上进行了训练,并且在模型文件中有更多的权重,这也使得它的运行成本更高。

GPT-4 在一系列基准测试中的表现优于 GPT-3.5

OpenAI 称它使用了微软 Azure 来训练模型,但没有公布有关具体模型大小或用于训练它的硬件的详细信息。

据悉,GPT-4 参加了多种基准考试测试,包括美国律师资格考试 Uniform Bar Exam、法学院入学考试 LSAT、“美国高考”SAT 数学部分和证据性阅读与写作部分的考试,在这些测试中,它的得分高于 88% 的应试者。

OpenAI 表示,已经与多家公司合作,要将 GPT-4 结合到他们的产品中,包括 Duolingo、Stripe 和 Khan Academy。GPT-4 模型也将以 API 的形式,提供给付费版 ChatGPT Plus 的订阅用户,允许开发者付费将 AI 集成到他们的应用程序中。微软表示,新款的必应(Bing)搜索引擎将运行于 GPT-4 系统之上。

在 OpenAI 宣布开发出 GPT-4 后,马斯克在推特上评论了这一消息,表达了他对人工智能对就业市场的潜在影响的担忧。马斯克在他的推文中写道:“我们人类还能做什么?我们最好继续使用 Neuralink!(马斯克旗下脑机接口公司)!”

编程能力牛到让我睡不着

在 GPT4 的发布会上,OpenAI 的总裁和联合创始人 Greg Brockman 展示了 GPT-4 拥有的强大编程技能,有一段两分钟的精华,演示的内容是:

1. 在草稿本上用纸笔画出一个非常粗糙的草图;

2. 拍照告诉 GPT-4 我们要做一个网站,效果就是图中这样,让 GPT-4 生成网站代码;

3. GPT-4 自己实现一个网站,总共历时十秒钟左右。

这效果给当下不少开发者带来了压力以及非常强烈的职业危机感,有人当即表示“睡不着了”:“辗转反侧了一个晚上,思考未来 5-10 年我们到底会在哪里。”

虽然 GPT-4 用 Leetcode 测试结果来表示自己还没有准备好替代程序员,但是不少人试验了用 GPT-4 来开发游戏以及编程。

Pietro Schirano 从事 AI 设计,以前是 Uber、Facebook 的产品设计师,他尝试了用 GPT-4 来开发游戏:“GPT-4 是一项令人难以置信的变革性技术。我花了不到 60 秒的时间,重新创建了乒乓球游戏。这还仅仅是我的第一次尝试。这个世界开始变得不一样了。”

另一位表示自己对 JavaScript 完全不了解的设计师 Ammaar Reshi,使用 Chat GPT-4 和在线集成开发环境,在 20 分钟内编写和调试了一整个的贪食蛇游戏。

根据他的讲述,他首先要求 GPT-4 提供贪吃蛇游戏的代码,以及运行该游戏所需的相关 HTML、CSS 和 JavaScript,以足够让他启动项目。虽然 GPT-4 无法在一次回复中完成所有操作,但 Ammaar Reshi 只需要不停回复“继续”即可。

获得游戏所需的所有代码后,Ammaar Reshi 创建了一个 Replit 在线集成开发环境帐户,并开启了一个新 HTML、CSS、JS 项目。然后,他将代码粘贴到开发环境的相关文件中,点击运行,游戏就能基本按预期工作了!最开始的时候,生成出来的蛇在第一次咬人后会死掉而不是长大,并且它一直以 2 而不是 1 的增量增加分数。所以 Ammaar Reshi 要求 GPT-4 进行调整,让人吃惊的是,GPT-4 再次做到了!

以上这些设计师还是编程外行,那么程序员们用 GPT-4 进行了哪些尝试呢?

Sualeh Asif 是一位专业人士,他的公司正在创建一个利用 GPT-4 强大功能的 AI 代码编辑器,希望将来能作为 VS Code 的直接替代品。他表示在帮助 OpenAI 进行部分测试之后,有一件事对他来说很突出:GPT-4 在编码方面非常出色!

Sualeh Asif 表示他们在公司内部使用 GPT-4 已经几个月了,积累了很多例子,所以他在 GitHub 上给出了一些代码展示。

这些示例足够说明 GPT-4 处理 Bazel、Kube、Terraform 和 Rust 的能力。

其中,GPT-4 能将 Python 函数转换为深奥但正确的 C++ 代码;可以处理 Bazel 的复杂性,帮助我们以 10 倍的速度编写 Bazel 代码;能将 Kube 部署转换为使用 Terraform;还能为常见和深奥的任务编写 CLI......

GPT-4 带来职业危机?

ChatGPT 的推出在科技界引发了一场狂潮,而 GPT-4 展现出的能力则更让人担忧。

如果不论别的职业,单就软件工程师岗位来说,不少开发者已经开始担心在未来的几十年内,AI 会循序渐进地取代一些开发岗位。

有网友说道:“我一直希望自己能成为一名软件工程师,作为一名年轻人,我有些害怕。”

有人回应说,很多人认为 GPT-4 在代码方面非常出色,并且担心他们会失业,但“GPT-4 能参加充满废话的会议吗?能帮我拍经理的马屁吗?能奉承管理层说他们的想法很好吗?它们还不行,所以我想我的工作现在是安全的。”

GPT-4 再次给我们敲响了警钟:拥有如此强大的编程能力,AI 真的会取代程序员?前段时间,前哈佛大学计算机科学教授、谷歌工程主管 Matt Welsh 还曾对此发出断言,表示“生成式 AI 将在 3 年内终结编程”,放在当下来看,也许 Welsh 所言非虚。

Welsh 认为,由于 ChatGPT 和 Copilot 等技术的出现,编程正处于从人类工作转变为机器人工作的转折点。在他看来,程序员需要演变成 AI 程序的“老师”——或者产品经理,或者代码评审人员。他认为这两个人类角色相对来说不那么受机器人的影响。“不要指望你的程序员职业生涯会一直持续下去,因为机器正在取代这个角色。”Welsh 说道。

他认为,具有编程能力的人类将承担“评审和阅读 AI 生成的代码,并确保它们能够正常运行以及做正确的事情”的任务。至于程序员,以及那些即将加入这一领域的人,他们将需要成为 AI 的老师,而不是程序员本身。Welsh 说:“这是关于如何教会 AI 写代码,而不是自己写。”

也许我们正处于一个动荡的周期之中,现在的问题不是会不会被取代,而是 AI 将在多大程度上改变软件行业,而我们也需要为未来做好准备:现在就必须习惯人工智能,毕竟让 AI 帮助我们编程就在不远的未来。

参考链接:

https://github.com/anysphere/gpt-4-for-code

https://openai.com/research/gpt-4https://www.infoq.cn/news/qR0xQrafpDi92bTPal6t

https://www.infoq.cn/article/eGbSZBSKWEDxspQq8FLh

今日好文推荐

97.5%的技术老大对涨薪这事儿比较乐观|InfoQ 研究中心联合TGO 鲲鹏会发布《中国科技领导者画像研究报告 2023》

被ChatGPT带热的最新技术岗:无需编码,年薪超200万

腾讯QQ空间技术总监、47岁T13级前端专家被裁;GPT-4下周发布,支持视频、更具颠覆性;我国拟组建国家数据局 | Q资讯

马斯克被Twitter脆弱的代码“逼疯”,要求全部重写!网友:重构是空降领导了解当前系统最快的方式?

活动预告

2023 年 3 月 17-18 日,ArchSummit 全球架构师峰会将落地北京海航万豪酒店。来自百度、京东、华为、腾讯、斗鱼、中国信通院等企业与学术界的技术专家,将就数字化业务架构、低代码实践、国产化替代方案、分布式架构等主题展开分享讨论。

目前已上线数字化场景下的业务架构、低代码实践与应用、国产软件优化迭代之路、多数据中心的分布式架构实践、软件质量保障、技术 - 产品 - 业务、高并发架构实现、架构师成长与团队搭建落地实践、大数据和人工智能融合、大规模微服务架构演进、可观测技术落地、云原生大数据实践等多个专题,点击阅读原文去官网查看大会日程。

团体购票可享大额优惠,购票及其他问题咨询请联系票务同学:15600537884(微信同电话)。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存